“不同于早期的理论与算法互相促进的发展过程,深度学习在应用领域的成功已经远超我们对其原理的深刻理解。传统的机器学习理论已无法适用于深度学习”。北京大学王立威教授的观点一出,立即引起人们的共鸣和赞叹。他说:“深度学习理论需要综合考虑网络容量、优化算法以及数据分布等方面的问题了。”
中科院计算所的兰艳艳副研究员从统计学习的角度进行了补充,她认为,“未来需要与统计理论深度融合,提升算法的泛化性能和可靠性”。
“机器学习的主流方法(如深度学习)通常依赖大量的标注训练样本。如何降低标注数据的需求,提升机器学习的普适性是当前面临的一个挑战。” 东南大学张敏灵教授认为:“在大数据环境下,随着各种新兴数据分析场景不断涌现,弱监督学习的框架拓展、模型构建以及技术利用有望成为未来机器学习研究与应用的重要方向。”
中国科技大学徐林莉教授认为:“未来的无监督学习研究需要突破人为设定‘标准’的局限,尽可能学习到非预先定义的知识。领域知识与数据有机结合、强化学习以及人类学习是值得探索的方向。”
这是今年4月21~23日,中国计算机学会(CCF)举行的首期启智会的一个场景。会议在北京美丽的怀柔召开,国内10家单位的14位专家出席。大家或围座一起,或两三人的思想碰撞,围绕机器学习理论、问题、前景、未来展开了热烈讨论。清华大学副教授、CCF学术工委主任助理朱军担任主持人。
朱军说,当前机器学习大热。各大主要IT公司不但纷纷投入人力物力发展机器学习,机器学习也成为高校青年学者选择的热门方向。不仅如此,机器学习还成为众多应用领域解决问题的首选技术方案。很多新型创业公司也将核心业务构建在机器学习技术之上。
那么,什么是机器学习?目前是机器学习的最好时代吗?机器学习面临哪些挑战?未来之路又在哪里?
在深度学习的未来发展方向上,电子科技大学徐增林教授及多位专家一致认为,“在融入更多应用(尤其是关键领域)的同时,深度学习的鲁棒性、可解释性、在不确定性与不完全信息环境下的推理与决策是未来值得重点关注的方向。”
西安交大孟德宇教授认为,“构造机器学习策略对大数据中的随机性信息进行细致建模,即面向数据的误差函数自适应学习与刻画,成为当前不可回避的重要问题,主要体现为如何特别针对‘空间’、‘维度’和‘时间’的开放性,设计有效的机器学习误差建模策略与算法设计机理。”华南理工大学余志文教授认为:“自适应机器学习需要有效处理高维大数据所带来的各种问题,如:高维、噪音、冗余特征、不平衡和混合类型数据,以及在此过程中如何设计自适应过程。”针对机器学习的鲁棒性,南京大学李宇峰副研究员认为,“由于数据稀缺、环境的开放性和动态变化等因素,机器学习很难通过提高预测性能来减少危害。在现实任务中要减少危害、提高可靠性,机器学习需要至少克服两个难点:(1)标记数据少;(2)环境动态变化。未来的研究需要在机器学习的各个环节,即数据、模型和评价,来提升鲁棒性。”
专家们还受到脑科学、博弈论等领域的启发,探寻机器学习的未来方向。山西大学钱宇华教授认为,“为了提高机器学习在多任务、多场景和动态环境下的适应性,借鉴生命科学的进化论原理、探索更高阶的智能理论与方法是未来值得探索的途径”。南京大学俞扬副教授认为,“非梯度优化技术在大量局部极值和不可导问题上具有明显优势,可超越梯度优化方法”。“博弈与学习结合,一方面通过强化学习求解近似均衡的策略模型,提升决策速度;另一方面,博弈可用于辅助学习,通过均衡约束正则化学习系统。”
王立威、兰艳艳等多位专家一致认为,“知识与统计相结合是机器学习的一个重要方向,是降低学习所需的样本数据,融合先验知识,突破数据分布的泛化,提高可解释性的可能途径。”
在应用方面,南京大学黎铭副教授深入讨论了机器学习走向实际应用过程中面临的挑战。他认为,“在不同应用中,数据的内在结构与特性各不相同,采用通用机器学习技术将难以有效发掘数据内蕴模式,针对特定领域数据特性设计与之相符的学习方法是一个重要趋势。”展望未来,他认为,“若能发展出一套易使用的机器学习新范型新技术,使非机器学习专业人员也能根据应用需求轻松地获得有效的模型,则将帮助机器学习在更多应用中发挥效用。”南京航空航天大学张道强教授也分享了机器学习与脑影像分析结合的实际案例,认为“未来值得重点关注的方向包括基于无监督、半监督和主动学习的多模态特征表示与融合、基因数据和脑影像表型间的有效关联分析、脑连接网络构建与分析。”
CCF秘书长杜子德,CCF副秘书长、学术工委主任陈熙霖也来到现场参加了讨论。
美国工程院院士、卡内基梅隆大学机器学习系创系主任汤姆·米切尔(Tom Mitchell)教授曾预测:“将来,机器学习会像微积分一样,成为一门基础学科。”现在的发展趋势似乎也在印证这个预判。可以想象未来只要有数据处理需求的领域,机器学习技术便有发挥的场所,未来前景非常值得期待。同时,也有人说:“现在是机器学习最好的时代,也是最坏的时代。”工业界快速发展的应用,行业巨头的大力投入,创业公司的蓬勃生机,这些都是当下机器学习繁荣的写照。但是,机器学习面临的挑战也非常明显。机器学习到底处于什么时代呢?这有待于读者的判断。 ■
本次启智会的专家包括:(按姓氏拼音为序)
陈熙霖 兰艳艳 黎 铭 李宇峰 孟德宇
钱宇华 王立威 徐林莉 徐增林 余志文
俞 扬 张道强 张敏灵 朱 军(组织者)
上述观点均来自各位专家,由组织者汇总撰稿
所有评论仅代表网友意见